logo

1 Introduction

1.1 Objectif

Ambition : proposer un cadre de vie dans lequel les flux cyclistes sont sécurisés et des moyens sont mis en oeuvre pour systématiquement réduire l’occurrence d’accidents impliquant des cyclistes

Analyse a posteriori : Identifier les zones accidentogènes d’un territoire pour les cyclistes à travers l’analyse des flux et des caractéristiques des lieux d’accident

Analyse a priori : identifier les zones susceptibles de présenter des caractéristiques accidentogènes sur la base de l’analyse a posteriori

Reproductibilité : Proposer un modèle d’analyse générique pour permettre de réaliser l’évaluation d’un territoire par une collectivité, une association ou des usagers avertis avec comme objectif de proposer des évolutions de la voirie susceptible de réduire l’accidentologie

1.2 Besoins

T1 - Définir les caractéristiques types des zones accidentogènes à travers l’analyse fine de la voirie, des flux, de la météo et de toutes propriétés discriminantes

T2 - Identifier les zones d’un territoire géographique susceptible de présenter des critères accidentogènes sur la base de ces critères

Data > Produire un module d’analyse open-source, documenté et partagé pour les zones accidentogènes.

Communication > Promouvoir le modèle d’analyse à travers un site internet, un github et des outils de communication à destination des cibles identifiés

1.3 Cibles

1- Les collectivités pour les aider à prioriser les investissements dans les équipements de sécurisation de voirie des flux cyclistes sur leurs territoires.

2- Les associations de cyclistes pour analyser les territoires et appuyer leurs plaidoyers pour demander des évolutions des pratiques des collectivités

3- Les fournisseurs de service d’itinéraires cyclistes pour intégrer le contournement de zones identifiables comme plus accidentogènes dans leurs calculs

2 Analyse de données

2.1 Analyse descriptive

2.1.1 Analyse des variables de la table usagers_epci

## [1] 548

Nous avons pris les informations de la table usagers_epci pour les accidents qui sont dans la table Accidents_velo_epci_sf. Ainsi, notre étude se concentre sur les accidents de vélo et nous excluons les accidents qui ne concernent que les voitures, piétons, …. Nous avons donc une table merged_usager qui contient cela.

Avec “length(unique(merged_usager$Num_Acc))”, on se rend compte que cette table merged_usager contient tous les accidents, et pour chaque accident on a au minimum 1 individu en vélo impliqué. Les autres individus peuvent être en voiture, en transport en commun ou bien à pied.

2.1.1.1 Variable trajet

2.1.1.1.1 Graphique du nombre d’accidents en fonction du motif de déplacement

On se rend compte que les accidents impliquant un vélo se déroule souvent lors de loisirs ou de promenade.

2.1.1.1.2 Graphique du nombre d’accidents en fonction du motif de déplacement et de l’heure

Nous pouvons observer par exemple, que les accidents se déroulent plus souvent lors de trajet “Domicile-travail” vers environ 9h du matin et lors de trajet de “promenade-loisirs” vers 19h ce qui coincident avec la réalité.

2.1.1.2 Variable Locp

## 
##  -1   0   1   2   3   4   5   8   9 
##  75 950   1   6   3   5   6   1   2

La plupart des localisations des piétons sont “sans objet” (correspond au 0), ce n’est donc pas très utile d’en tirer de l’information.

2.1.2 Méthode du chi-carré

2.1.3 Augustin

Observons le nombre d’accident par mois de 2005 à 2021, sur Montpellier Méditerrannée Métropole (MMM). Nous observons un pic du nombre d’accidents au mois de Septembre. Nous pouvons faire l’hypothèse que c’est la période où il y a le plus de cyclistes, car c’est le début de l’année scolaire, et que les jours sont encore assez chauds. On remarque un faible nombre d’accident durant tous les mois d’hiver. Nous faisons l’hypothèse qu’il y a une baisse du nombre de cycliste en automne-hiver. Le mois d’août est le troisième mois le plus faible, c’est la période où la plus grande partie des gens est en congé, donc la circulation est plus faible.

Ce graphique montre bien l’évolution du nombre d’accident au cours des mois. Nous supposons que le nombre d’accident est lié au nombre de cyclistes.

Observons le nombre d’accident par mois pour chaque année, de 2005 à 2021, sur MMM. Nous pouvons sélectionner un seul mois ou plusieurs pour mieux les comparer. On peut ainsi voir qu’il y a des mois qui sont au de-dessus d’autres, pour toutes les années confondues (septembre est toujours au dessus d’août, ou équivalent). Aussi, Certains mois ont une très grande variabilité suivant les années. C’est le cas du mois d’avril par exemple.

Nous avons supposé que la luminosité au moment de l’accident peut être un facteur déterminant. Nous observons sur ce graphique que la très grande majorité des accidents a lieu en plein jour. En effet, c’est en plein jour qu’il y a le plus de cyclistes, et le plus d’automobilistes. C’est ensuite la nuit avec éclairage public allumé qu’il y a autre partie des accidents. C’est sans doute car les accidents ont majoritairement lieu en ville.

Observons les heures des accidents. On constate les pics d’accidents aux horaires de pointe : 8h-9h et 17h-18h. C’est en effet l’heure où il y a le plus de circulation. La nuit, il n’y presque pas d’accident (comme le montrait aussi le graphique précédent).

Nous avons aussi regardé quelle est la part des accidents entre l’agglomération et hors de l’agglomération. On peut facilement voir que la plus grande part des accidents a lieu en agglomération.

Grâce à ce graphique à double échelles, nous pouvons comparer les accidents entre agglomération et hors agglomération. Ce qui est intéressant est de regarder si les pics ont lieu aux mêmes horaires. Or comme nous l’avions déjà observé précédemment, en agglomération, le pics d’accient à lieu aux heures de pointe (8h-9h et 17h-18h). En revanche, hors agglomération, le pic a lieu dans la matinée vers 11H. Nous pouvons supposer que cela concerne plutôt des déplacments de types loisirs, et à des heures ou la circulation automobile est faible.

Analysons les types d’intersections sur le lieu des accidents. On se demande si les accidents ont lieu sur des routes sans intersection ou bien sur des intersections. On oberve que le plus grand nombre d’accident a lieu sur des routes hors intersection.

Toutefois, on a une variable Hors interection mais plusieurs variables décrivant les différents types d’intersections. On fait la comparaison entre les accidents hors intersection et les accidents ayant lieu sur tous types d’intersection .

Une fois que les différents types d’intersections sont rassemblés en une seule colonne, on voit que l’écart est nettement plus faible. Les accidents hors intersection restent majeurs.

Observons les différentes catégories de routes sur le lieu d’accident. On voit que la plus grande part des accidents a lieu sur des routes communales. Cela englobe toutes les voies qui appartiennent au domaine public routier communal. Ce sont les routes que nous empruntons chaque jour en ville. Comme leur nom l’indique, les routes communales se trouvent en agglomération. C’est donc cohérent par rapport au fait que la plus grande majorité des accidents a lieu en agglomération.

2.2 Analyse en Composantes Principales (ACM)

2.3 Zone accidentogène

2.3.1 Analyse et cartographie des accidents et des pistes cyclables avec leurs limitations de vitesse

2.3.1.1 Graphique

Nous pouvons constater qu’il y a plus d’accidents en vélo lorsque la limitation de vitesse est de 50.

Nous pouvons supposer que c’est en ville qu’il y a le plus d’accidents, là où la route est limitée à 50 km/h. Les zones limitées à 5 km/h correspond aux zones piétonnes donc il y a peu de chances qu’il y est des accidents. De plus, sur les routes limitées à 70 et 80 km/h, on ne trouve que peu de cycliste donc il n’est pas étonnant de voir qu’il y a moins d’accident.

2.3.1.2 Carte des pistes cyclables

2.3.2

2.3.3 Heatmap de la densité des points dans la métropole en fonction des tags qui définissent le plus le risque d’accident

Voici une carte affichant la densité des points où chacun de ces points correspond à un tag. Les types de tags ont été choisi en fonction des types qui appraissaient chez au moins 10 accidents, et qui étaient les plus pertinents à analyser.

2.4 Création de la table avec 300 colonnes correspondant aux tags, et 548 lignes correspondant aux accidents

Comme dit précedemment, nous possédons déjà les informations de OpenStreetMap dans une table et elle se nomme “Tampon_Accidents_velo_osm_sf”. Elle contient pour chaque tampon, donc pour chaque zone de 30 mètres autour de chaque accident, des informations sur la limitation de vitesse, le type de route, etc….

On va donc, pour pouvoir analyser ce jeu de données:

2.4.1 Analyse sur la table des tags

2.4.1.1 Triage en fonction des tags qui apparaissent le plus lors d’accident et les plus pertinents

## Pour faire le test de Khi-2 sur des paires  sur toutes les variables, j'ai eu besoin de diminuer le nombre de variable pour limiter le temps d'exécution. J'ai donc limiter à 10 apparations minimum de chaque tags (variable) parmi tous les individus. Je me retrouve donc avec 49 tags.
## De plus, j'ai trié les tags en fonction de ceux qui apparaissent chez au moins 10 accidents et ceux étant les plus pertinents pour l'analyse
## De plus, il n'y a que 224 individus qui possèdent au minimum 1 tag ce qui est faible.

2.4.1.2 chi-carré

##                            tag1                          tag2       p_value
## 1             "railway"=>"tram"  "boundary"=>"administrative" 1.948618e-114
## 2                  "lanes"=>"4"                 "layer"=>"-1" 7.364762e-107
## 3               "tunnel"=>"yes"         "cyclability"=>"good"  1.440685e-38
## 4              "maxspeed"=>"50" "electrified"=>"contact_line"  4.502398e-37
## 5              "maxspeed"=>"50"  "boundary"=>"administrative"  5.361582e-32
## 6              "maxspeed"=>"50"             "railway"=>"tram"  7.980395e-31
## 7              "maxspeed"=>"50"                  "lanes"=>"2"  1.613054e-30
## 8       "boundary"=>"political"  "cyclability"=>"inadvisable"  1.048147e-26
## 9                 "layer"=>"-1"   "cyclability"=>"acceptable"  1.894204e-24
## 10         "foot"=>"designated"         "cyclability"=>"good"  3.935560e-23
## 11                 "lanes"=>"4"   "cyclability"=>"acceptable"  5.579280e-23
## 12        "cyclability"=>"good"                            NA  1.326436e-22
## 13                 "layer"=>"1"                  "lanes"=>"1"  2.009026e-21
## 14            "railway"=>"tram"      "cycleway:right"=>"lane"  1.149531e-20
## 15        "footway"=>"sidewalk"               "tunnel"=>"yes"  4.433612e-20
## 16 "boundary"=>"administrative"      "cycleway:right"=>"lane"  7.486434e-20
## 17                "foot"=>"yes"                  "lanes"=>"1"  1.289797e-19
## 18                 "lanes"=>"2"           "segregated"=>"yes"  8.432454e-19
## 19            "railway"=>"tram"                "oneway"=>"no"  2.582290e-18
## 20             "maxspeed"=>"50"         "footway"=>"sidewalk"  3.052446e-18
##      x_carre
## 1  516.95178
## 2  482.12588
## 3  168.67499
## 4  161.83176
## 5  138.60951
## 6  133.24777
## 7  131.85070
## 8  114.43170
## 9  104.13049
## 10  98.12113
## 11  97.43005
## 12  95.71541
## 13  90.33659
## 14  86.88612
## 15  84.21691
## 16  83.18125
## 17  82.10601
## 18  78.39596
## 19  76.18551
## 20  75.85522

Nous pouvons observer les 20 premières paires les plus significativement liées.

Les tags sélectionnés pour faire les paires ne correspondent qu’aux tags qui apparaissent dans chez au moins 10 accidents, et qui sont les plus pertinents à étudier.

Interprétation:

Il y a plus d’accident près dans un tunnel lorsqu’il y a un bon niveau de cyclabilité.

Voici la source de toutes les descriptions des différents tags:

OpenStreetMap Taginfo

2.5 Analyse sur tous les tags qui existent à Montpellier

2.5.1 Création du dataframe contenant les points de tous les tags de la métropole en fonction des tags qui apparaissent le plus lors d’accident et qui sont les plus pertinents

## Simple feature collection with 41409 features and 2 fields
## Geometry type: POINT
## Dimension:     XY
## Bounding box:  xmin: 3.39348 ymin: 43.46661 xmax: 4.071083 ymax: 43.77603
## Geodetic CRS:  WGS 84
## # A tibble: 41,409 x 3
##    osm_id  other_tags                                     geometry
##  * <chr>   <chr>                                       <POINT [°]>
##  1 4082728 "\"electrified\"=>\"contact_line\"" (3.898773 43.62639)
##  2 4082881 "\"bicycle\"=>\"designated\""       (3.897698 43.60829)
##  3 4082881 "\"foot\"=>\"designated\""          (3.897698 43.60829)
##  4 4082881 "\"lit\"=>\"yes\""                  (3.897698 43.60829)
##  5 4082885 "\"bicycle\"=>\"designated\""        (3.896882 43.6041)
##  6 4082885 "\"bridge\"=>\"yes\""                (3.896882 43.6041)
##  7 4082885 "\"foot\"=>\"designated\""           (3.896882 43.6041)
##  8 4082885 "\"layer\"=>\"1\""                   (3.896882 43.6041)
##  9 4082885 "\"lit\"=>\"yes\""                   (3.896882 43.6041)
## 10 4082885 "\"segregated\"=>\"no\""             (3.896882 43.6041)
## # ... with 41,399 more rows

Voici le dataframe contenant tous les tags qui existent à Montpellier en filtrant en fonction des tags sélectionnées précedemment.

2.5.2 Création de la carte affichant la densité des points dans la métropole en fonction des tags qui définissent le plus le risque d’accident